上次說完要怎麼創建 Series,這次來說說我們該要怎麼去使用它。
排序
Series 可以根據索引或是根據值去做排列。
series1 = pd.Series([1, 2, 3, 4, 5])
print(series1.sort_values(ascending=False))
print(series1.sort_index())
ascending=False 是降序的意思。
數學運算
Series 可以直接進行數學運算,這些操作會自動應用到每個元素上。
series1 = pd.Series([1, 2, 3, 4, 5])
print(series1 + 5) # 每個元素加上 5
print(series1 * 2) # 每個元素乘以 2
應用函數
可以對 Series 使用各種函數來進行數據處理,例如計算平均值、最大值、最小值等。
函式 | 說明 |
---|---|
series.mean() | 計算平均值 |
series.max() | 計算最大值 |
series.min() | 計算最小值 |
series.sum() | 計算總和 |
判斷操作與篩選
Series 允許你進行布林判斷,可以用來篩選符合條件的元素。
print(series1 > 3) # 判斷哪些元素大於 3
print(series1[series1 > 3]) # 篩選大於 3 的元素
自定義索引
Series 也可以自定義索引,並利用自訂的索引來搜尋元素。
series_a = pd.Series([1, 2, 3], index=['a', 'b', 'c'])
series_b = pd.Series([4, 5, 6], index=['b', 'c', 'd'])
print(series_a['b']) # 2
print(series_b['b']) # 4
自動對齊和運算
當你對兩個 Series 進行運算時,Pandas 會根據索引自動對齊數據,無法對齊的部分會用 NaN 表示。print(series_a + series_b)
結果如下:
a NaN
b 6.0
c 8.0
d NaN
重新定義索引
Series 可以透過函式重新定義索引,並且可以給空的索引一個預設值。
series_a = series_a.reindex(['a', 'b', 'c', 'd'], fill_value=0)
print(series_a)